让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间 让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间 关键词: AI新闻,Gemini Embedding 2,Gemini,多模态嵌入模型 刚刚,谷歌发布了首个原生多模态(Multimodal)嵌入模型——Gemini Embedding 2。这次模型最大的变化在于:把文本、图像、视频、音频和文档,全部映射进同一个统一的嵌入空间。 来自主题: AI资讯 6128 点击 2026-03-11 16:59